مقاوم سازی بازشناسی گفتار برمبنای سیستم شنیداری انسان

thesis
abstract

در این پایان نامه، یک الگوریتم استخراج ویژگی جدید را معرفی می کنیم که pncc نامیده می شود و مبتنی بر سیستم شنیداری انسان می باشد. ویژگیهای جدید pncc شامل یک غیر خطی قانون توان است که جایگزین غیر خطی لگاریتمی استفاده شده در mfcc شده است، و همچنین شامل یک الگوریتم جدید برای حذف تحریک پس زمینه-با استفاده از تخمین توان با طول متوسط مبتنی بر نسبت میانگین حسابی به میانگین هندسی-و همچنین کاهش توان پس زمینه ی با طول متوسط می باشد. این الگوریتم استخراج ویژگی مقاوم که مبتنی بر روش کاهش بایاستوان است، با یک آستانه برای چگالی طیف توان ترکیب شده است. سطح بایاستوان بعنوان سطحی انتخاب می شود که توزیع توان را تیزتر می کند. این تیزی را با استفاده از نسبت میانگین حسابی به میانگین هندسی از توان با طول متوسط محاسبه می کنیم. با کاهش این سطح بایاس، کف سازی توان برای بهبود مقاوم سازی بکارگرفته می شود. در حالیکه این الگوریتم ساده تر از pncc اولیه است، نتایج آزمایش نشان می دهد که pncc جدید عملکرد بهتری نسبت به پیاده سازی قبلی دارد.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

مقاوم سازی سیستم بازشناسی گفتار پیوسته

دقت سیستم¬های بازشناسی گفتار در محیط¬های آزمایشگاهی و کنترل شده به میزان قابل قبولی افزایش یافته و امروزه شاهد استفاده از این سیستم¬ها در محیط¬های واقعی هستیم. با این حال، کارایی این سیستم¬ها در حضور نویز به دلیل عدم تطابق بین شرایط و محیط آموزشی و آزمون به شدت افت می¬کند. علاوه بر این، تنوع مشخصه¬های گفتاری گویندگان نیز بر کارایی این سیستم¬ها تاثیرگذار است. در سال¬های اخیر، عمده پژوهش¬های صورت...

مقاوم سازی بازشناسی گفتار با اعمال پردازش زیرباندی

در این پروژه مقاوم سازی بازشناسی گفتار در محیط های نویزی بر مبنای پردازش زیرباندی بررسی شده است. مقاوم سازی بازشناسی گفتار یکی از مسائل مهم در این حوزه می باشد که کار بر روی ان همچنان ادامه دارد. از روش های گوناگونی به منظور تحقق یافتن این مهم استفاده می شود و ایده های متنوعی نیز در مقالات و تحقیقات ارائه می گردند. عیب عمده اکثر روشهای پیشهاد شده پیچیدگی زیاد و سرعت کم الگوریتم های آن است. ما د...

15 صفحه اول

مقاوم سازی سیستم های بازشناسی گفتار و گوینده در مقابل نویزهای جمع شونده و نویز کانال

با توجه به اهمیت و نقش بالای مقاوم سازی سیستم های بازشناسی گفتار و گوینده در مقابل نویزهای محیطی، در این مجموعه ابتدا تأثیر استفاده از پیک های طیف دنباله خودهمبستگی به عنوان ویژگی های مقاوم برای استفاده در سیستم های بازشناسی گوینده مورد بررسی قرار گرفته است. سپس تأثیر روش های هنجارسازی ویژگی ها مانند روش حذف میانگین کپسترال، روش پس پردازش mva و روش ویژگی های مفقود بر پیک های طیف دنباله خودهمبست...

15 صفحه اول

بازشناسی اعمال انسان با رویکرد مقاوم سازی دسته بند تفکیکی

با توجه به گسترش روزافزون داده های ویدئویی، تحلیل و فهم خودکار محتوای داده های ویدئویی از اهمیت بیشتری برخودار گشته است. از میان کاربردهای متنوع فهم ویدئو، مواردی که به تحلیل حرکات و اعمال انسان می پردازند از توجه ویژه ای برخوردار شده اند. عوامل گوناگونی مانند تغییرات نوری و انسداد منجر به استخراج ویژگی های نامناسب می شود. از طرف دیگر انجام یک عمل به گونه های متفاوت باعث پدید آمدن نمونه های پَرت...

روشی جدید در بازشناسی مقاوم گفتار مبتنی بر دادگان مفقود با استفاده از شبکه عصبی دوسویه

Performance of speech recognition systems is greatly reduced when speech corrupted by noise. One common method for robust speech recognition systems is missing feature methods. In this way, the components in time - frequency representation of signal (Spectrogram) that present low signal to noise ratio (SNR), are tagged as missing and deleted then replaced by remained components and statistical ...

full text

روش های اتصال گرای جدید بر گرفته از سامانه ادراک گفتار انسان به منظور بهبود بازشناسی گفتار ماشینی

بازشناسی خودکار گفتار در شرایط عدم تطابق دادگان آموزش و آزمون، یکی از چالش های مهم در این مورد است. به منظور کاهش هر چه بیشتر این عدم تطابق، روش های مرسوم، سعی در بهسازی گفتار یا تطابق مدل آماری دارند. در این زمینه از جمله روش های دیگر می توان به آموزش مدل در شرایط مختلف اشاره کرد. موفقیت در این روش ها، در مقابل کارایی سیستم درک و بازشناسی در انسان بسیار ابتدایی به نظر می رسد...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023